Pour ce projet le travail principal était donc d'implémenter un programme qui dans un
premier temps récupère des données sur un site web distant. Ensuite, à partir des données, de 
construire une base de données locale, en passant par l'extraction et la génération des données. Une fois les
données mises en place, le coeur du travail, le calcul des signatures taxonomiques a pu être fait. Enfin après avoir effectué l'apprentissage statistique, les résultats des validations-croisées sont assez satisfaisants. Nous avons environs 90\% d'instances correctement classées en validation croisée. La documentation, permet à un développeur d'apporter des améliorations ou d'ajouter des fonctionnalités.
~\\

Pour conclure, ce projet nous a énormément appris, nous ressortons avec une connaissance approfondie du langage Perl notamment
pour le module bio-perl. Nous avons été sensibilisés sur la complexité en temps du programme au regard de la taille des données sur lesquelles nous avons travaillé. Nous avons été contraints de passer au langage C suite à des échecs d'un point vue complexité temporelle en Perl. Nous avons aussi apprécié de travailler avec l'ensemble  d'outils que propose Weka et avons été surpris par son efficacité pour manipuler et analyser les données et par sa facilité d'utilisation. Étant tous les deux inscrits au module d'enseignement Fouille De Donnée (FDD), la possibilité d'utilisation plus poussée de weka, que nous utilisions aussi en FDD nous à permis d'y voir de multiples autres aspects intéressants.
~\\

Finalement nous avons confirmé notre attrait pour la recherche en bio-informatique et avons pris beaucoup de plaisir à faire partie de l'équipe BONSAI du LIFL, dont l'ambiance de travail est très agréable. Si la possibilité s'offre à nous de postuler pour une thèse dans ce domaine après notre Master, nous n'y manquerons pas.
